Llajú: Un sistema de recuperación multilingüe basado en EuroWordNet

نویسندگان

  • Fernando Martínez Santiago
  • Manuel Carlos Díaz-Galiano
  • Luis Alfonso Ureña López
  • Maria Teresa Martín-Valdivia
  • Manuel García Vega
  • Jose Ramón Balsas Almagro
چکیده

1 Introducción El sistema de recuperación de información multilingüe LLajú aquí presentado viene a ser una implementación del modelo sugerido en [1], con la mejora en el cálculo de probabilidades de traducción a partir de SemCor tal como se describe en [2]. El sistema de recuperación que proponemos es capaz de recuperar artículos de las secciones de nacional e internacional de los sitios de “ABC”, “El Mundo” y “El País”, y de las secciones de internacional del “Washington Post”, “CNN news” y “The Guardian Observer”, correspondientes al año 2001. El proceso de recopilación y formateado del corpus se ha llevado a cabo usando la herramienta WebReader[3].

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Estudio Bidireccional de un Sistema de RI Multilingüe Basado en Traducción de n-Gramas

Resumen Continuando nuestra investigación sobre el empleo de ngramas de caracteres como unidad de traducción en sistemas de RI Multilingüe, este art́ıculo analiza el comportamiento de nuestra solución en direcciones inversas de traducción a partir de sendos experimentos paralelos con consultas en inglés sobre textos en español y viceversa. Lo positivo de los resultados corrobora la validez de nu...

متن کامل

IR-n un sistema de Recuperación de Información basado en pasajes

PhD Thesis in Computer Science written by Fernando Llopis Pascual under the supervision of Dr. José Luis Vicedo González and Dr. Antonio Ferrández Rodŕıguez (University of Alicante Spain). The author was examined in May 6th, 2003 by the commitee formed by Dr. Manuel Palomar Sanz (Univ. de Alicante), Alfonso Ureña López (Univ. de Jaén), Emilio Sanch́ıs Arnal (Univ. Politécnica de Valencia), Migue...

متن کامل

Construcción de un sistema de recuperación multilingüe en la Web

El proyecto ha sido financiado por el Ministerio de Ciencia y Tecnología en su programa de Fomento de la Investigación Técnica (PROFIT) con código FIT-150500-2002-416. La duración del proyecto es de 18 meses. Los grupos participantes son las Universidades de Alicante, Jaén y Sevilla, siendo el investigador responsable y coordinador el Dr. Antonio Ferrández Rodríguez, del departamento de Lenguaj...

متن کامل

Sistema de Suscripción basado en XML para noticias digitales

Resumen. En este trabajo se plantea la problemática del seguimiento de un gran flujo de información entrante en una base documental, y la notificación de las novedades significativas a los usuarios de acuerdo a los perfiles definidos en sus suscripciones. Se propone un sistema de suscripción que utiliza un nuevo lenguaje basado en XML, que permite especificar consultas considerando la estructur...

متن کامل

Medidas de Usabilidad de Componentes Software

La última década ha marcado el primer intento real de convertir el desarrollo software en una ingeniería usando los conceptos de Desarrollo Software Basado en Componentes (DSBC) y de Componentes COTS (Commercial Off-The-Shelf) cuyo objetivo es crear elementos de alta calidad que se puedan ensamblar para construir un sistema funcional. Uno de los procesos críticos dentro del DSBC es la selección...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 27  شماره 

صفحات  -

تاریخ انتشار 2001